隨著傳統(tǒng)IDC向云數(shù)據(jù)中心轉(zhuǎn)型,數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)也在不斷演進(jìn)。
在傳統(tǒng)的大型數(shù)據(jù)中心,采用了層次化模型設(shè)計(jì)的三層網(wǎng)絡(luò)。將復(fù)雜的網(wǎng)絡(luò)設(shè)計(jì)分成幾個(gè)層次,每個(gè)層次著重于某些特定的功能,這樣就能夠使一個(gè)復(fù)雜的大問(wèn)題變成許多簡(jiǎn)單的小問(wèn)題。三層網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)的網(wǎng)絡(luò)有三個(gè)層次:

接入層(將工作站接入網(wǎng)絡(luò))
接入層的面向?qū)ο笾饕墙K端客戶,為終端客戶提供接入功能,接入層的主要功能是規(guī)劃同一網(wǎng)段中的工作站個(gè)數(shù),提高各接入終端的帶寬。
匯聚層(提供基于策略的連接)
匯聚層連接網(wǎng)絡(luò)的核心層和各個(gè)接入的應(yīng)用層,在兩層之間承擔(dān)“媒介傳輸”的作用。在應(yīng)用接入核心層之前先經(jīng)過(guò)匯聚層進(jìn)行數(shù)據(jù)處理,以減輕核心層設(shè)備的負(fù)荷。匯聚層提供內(nèi)容交換、防火墻、SSL卸載、入侵檢測(cè)、網(wǎng)絡(luò)分析等服務(wù)。
核心層(網(wǎng)絡(luò)的高速交換主干)
核心層在互聯(lián)網(wǎng)中承載著網(wǎng)絡(luò)服務(wù)器與各應(yīng)用端口間的傳輸功能,是整個(gè)網(wǎng)絡(luò)的支撐脊梁和數(shù)據(jù)傳輸通道。核心交換機(jī)為進(jìn)出數(shù)據(jù)中心的包提供高速的轉(zhuǎn)發(fā),為多個(gè)匯聚層提供連接性,核心交換機(jī)通常為整個(gè)網(wǎng)絡(luò)提供一個(gè)彈性的L3路由網(wǎng)絡(luò)。
通常情況下,匯聚交換機(jī)是L2和L3網(wǎng)絡(luò)的邊界,匯聚交換機(jī)以下的是L2網(wǎng)絡(luò),以上是L3網(wǎng)絡(luò)。每組匯聚交換機(jī)管理一個(gè)POD,每個(gè)POD內(nèi)都是獨(dú)立的VLAN網(wǎng)絡(luò)。當(dāng)服務(wù)器在一個(gè)POD內(nèi)遷移時(shí),不必修改IP地址和默認(rèn)網(wǎng)關(guān),因?yàn)橐粋€(gè)POD對(duì)應(yīng)一個(gè)二層廣播域。
在匯聚路由器和接入交換機(jī)之間,使用生成樹(shù)協(xié)議(STP)構(gòu)建二層網(wǎng)絡(luò)的無(wú)環(huán)路拓?fù)?。生成?shù)協(xié)議有幾個(gè)優(yōu)點(diǎn):它很簡(jiǎn)單,是一種只需要很少配置的即插即用技術(shù)。但是,生成樹(shù)協(xié)議不能使用并行轉(zhuǎn)發(fā)路徑,往往會(huì)阻塞 VLAN 中的冗余路徑。
2010年,思科引入vPC(Virtual Port Channel)技術(shù),消除了生成樹(shù)阻塞端口,提供從接入交換機(jī)到匯聚路由器的雙活上行鏈路,充分利用可用帶寬。但vPC也不能真正做到完全的水平擴(kuò)展。
使用 vPC 進(jìn)行數(shù)據(jù)中心設(shè)計(jì)
傳統(tǒng)三層數(shù)據(jù)中心網(wǎng)絡(luò)挑戰(zhàn)
三層網(wǎng)絡(luò)架構(gòu)因其實(shí)現(xiàn)簡(jiǎn)單、配置工作量小、廣播控制能力強(qiáng)等優(yōu)點(diǎn),被廣泛應(yīng)用于傳統(tǒng) DCN。但隨著數(shù)據(jù)中心整合、虛擬化、云計(jì)算等技術(shù)的發(fā)展,傳統(tǒng)三層網(wǎng)絡(luò)架構(gòu)已經(jīng)無(wú)法滿足網(wǎng)絡(luò)的需求,主要原因有:
無(wú)法支撐虛擬機(jī)遷移所需的大二層網(wǎng)絡(luò)構(gòu)建
無(wú)法支持流量的無(wú)阻塞轉(zhuǎn)發(fā)(尤其是東西向流量)
虛擬機(jī)動(dòng)態(tài)遷移
虛擬化技術(shù)從根本上改變了數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的需求。通過(guò)服務(wù)器虛擬化可以有效地提供服務(wù)器利用率,按需提供服務(wù)和資源,降低能源消耗,降低客戶的運(yùn)維成本,所以得到了廣泛的應(yīng)用。
在虛擬化數(shù)據(jù)中心里,一臺(tái)物理服務(wù)器被虛擬化為多臺(tái)邏輯服務(wù)器,稱為VM,每臺(tái)VM都可以獨(dú)立運(yùn)行,有自己的OS,APP,也有自己獨(dú)立的MAC地址和IP地址。
虛擬化出來(lái)以后,就產(chǎn)生了虛擬機(jī)動(dòng)態(tài)遷移的需求,虛擬機(jī)動(dòng)態(tài)遷移是指在保證虛擬正常運(yùn)行的同時(shí),將一個(gè)虛擬機(jī)從一臺(tái)物理服務(wù)器移動(dòng)到另一臺(tái)物理服務(wù)器的過(guò)程。該過(guò)程對(duì)于最終用戶來(lái)說(shuō)是無(wú)感知的,所以要保證在遷移過(guò)程中,虛擬機(jī)的業(yè)務(wù)不能中斷。
虛擬機(jī)在動(dòng)態(tài)遷移時(shí),不僅要求虛擬機(jī)的IP地址不變、而且運(yùn)行狀態(tài)也必須保持(例如TCP會(huì)話狀態(tài)),這就需要遷移的起始和目標(biāo)位置必須在同一個(gè)二層網(wǎng)絡(luò)域之中。
由于限制,傳統(tǒng)數(shù)據(jù)中心的三層網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)根本無(wú)法滿足服務(wù)器虛擬化中更靈活的、可自定義的虛擬機(jī)遷移策略。
為了實(shí)現(xiàn)虛擬機(jī)的大范圍,甚至跨地域的動(dòng)態(tài)遷移,就要求把虛擬機(jī)遷移可能涉及的所有服務(wù)器都納用同一個(gè)二層網(wǎng)絡(luò)域,通過(guò)虛擬化的技術(shù)形成一個(gè)更大范圍的二層網(wǎng)絡(luò)。這樣才能實(shí)現(xiàn)虛擬機(jī)的大范圍無(wú)障礙遷移,這種適合虛擬機(jī)隨時(shí)隨地?zé)o障礙遷移的大范圍二層網(wǎng)絡(luò),我們稱之為大二層網(wǎng)絡(luò)。
數(shù)據(jù)中心的流量的轉(zhuǎn)變
數(shù)據(jù)中心的流量總的來(lái)說(shuō)可以分為以下幾種:
南北向流量:數(shù)據(jù)中心之外的客戶端到數(shù)據(jù)中心服務(wù)器之間的流量,或者數(shù)據(jù)中心服務(wù)器訪問(wèn)互聯(lián)網(wǎng)的流量。
東西向流量:數(shù)據(jù)中心內(nèi)的服務(wù)器之間的流量。
跨數(shù)據(jù)中心流量:不同數(shù)據(jù)中心的流量,例如數(shù)據(jù)中心之間的災(zāi)備,私有云和公有云之間的通訊。
在傳統(tǒng)數(shù)據(jù)中心中,業(yè)務(wù)通常采用專線方式部署。通常,服務(wù)部署在一個(gè)或多個(gè)物理服務(wù)器上,并與其他系統(tǒng)物理隔離。因此,傳統(tǒng)數(shù)據(jù)中心東西向流量較低,南北向流量約占數(shù)據(jù)中心總流量的80%。
在云數(shù)據(jù)中心,服務(wù)架構(gòu)逐漸從單體架構(gòu)轉(zhuǎn)變?yōu)閃eb-APP-DB,分布式技術(shù)成為企業(yè)應(yīng)用的主流。服務(wù)的組件通常分布在多個(gè)虛擬機(jī)或容器中。該服務(wù)不再由一臺(tái)或多臺(tái)物理服務(wù)器運(yùn)行,而是由多臺(tái)服務(wù)器協(xié)同工作,導(dǎo)致東西向流量快速增長(zhǎng)。
此外,大數(shù)據(jù)服務(wù)的出現(xiàn)使分布式計(jì)算成為云數(shù)據(jù)中心的標(biāo)準(zhǔn)配置。大數(shù)據(jù)服務(wù)可以分布在一個(gè)數(shù)據(jù)中心的數(shù)百臺(tái)服務(wù)器上進(jìn)行并行計(jì)算,這也大大增加了東西向流量。
傳統(tǒng)的三層網(wǎng)絡(luò)架構(gòu)是為南北向流量占主導(dǎo)地位的傳統(tǒng)數(shù)據(jù)中心設(shè)計(jì)的,不適合東西向流量較大的云數(shù)據(jù)中心。
一些東西向流量(如跨POD的二層和三層流量)必須經(jīng)過(guò)匯聚層和核心層的設(shè)備轉(zhuǎn)發(fā),不必要地經(jīng)過(guò)許多節(jié)點(diǎn)。傳統(tǒng)網(wǎng)絡(luò)通常設(shè)置1:10到1:3的帶寬超額比,以提高設(shè)備利用率。隨著超額訂閱率,每次流量通過(guò)節(jié)點(diǎn)時(shí)性能都會(huì)顯著下降。此外,第 3 層網(wǎng)絡(luò)上的 xSTP 技術(shù)加劇了這種惡化。
因此,如果通過(guò)傳統(tǒng)三層網(wǎng)絡(luò)架構(gòu)運(yùn)行大量的東西向流量,連接到同一交換機(jī)端口的設(shè)備可能會(huì)爭(zhēng)奪帶寬,導(dǎo)致最終用戶獲得的響應(yīng)時(shí)間很差。
Spine-Leaf架構(gòu)
Clos 網(wǎng)絡(luò)以其發(fā)明者Charles Clos命名,Charles Clos是一名電話網(wǎng)絡(luò)工程師,他在 1950 年代需要解決如何應(yīng)對(duì)電話網(wǎng)絡(luò)的爆炸式增長(zhǎng)這一問(wèn)題. 提出了現(xiàn)在稱之為 Clos 的網(wǎng)絡(luò)架構(gòu)。
一個(gè)簡(jiǎn)單的兩層Clos網(wǎng)絡(luò)
Spine-Leaf體系架構(gòu)是由Spine和Leaf這兩個(gè)交換層組成的數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。Leaf層由訪問(wèn)交換機(jī)組成,匯聚來(lái)自服務(wù)器的流量,并直接連接到Spine或網(wǎng)絡(luò)核心。Spine交換機(jī)在全網(wǎng)格拓?fù)渲谢ミB所有Leaf交換機(jī)。上圖中,綠色節(jié)點(diǎn)代表交換機(jī),灰色節(jié)點(diǎn)代表服務(wù)器。在綠色節(jié)點(diǎn)中,最上面的是Spine節(jié)點(diǎn),下面是Leaf節(jié)點(diǎn)。
Spine-Leaf架構(gòu)更適合滿足現(xiàn)代應(yīng)用程序的需求,例如高吞吐量和低延遲。
Spine交換機(jī)具有高吞吐量、低延遲且端口密集,它們與每個(gè)Leaf交換機(jī)都有直接的高速 (40-400Gbps) 連接。
Leaf交換機(jī)與傳統(tǒng)TOR交換機(jī)非常相似,它們通常是 24 或 48 端口 1、10 或 40Gbps的接入層連接。但是,它們?cè)黾恿说矫總€(gè)Spine交換機(jī)的 40、100 或 400Gbps 上行鏈路的能力。
Spine-Leaf架構(gòu)與傳統(tǒng)網(wǎng)絡(luò)設(shè)計(jì)有何不同?
傳統(tǒng)數(shù)據(jù)中心的網(wǎng)絡(luò)通?;谌龑幽P停?/p>
接入交換機(jī)連接到服務(wù)器
匯聚交換機(jī)為接入交換機(jī)提供冗余連接
核心交換機(jī)在匯聚交換機(jī)之間提供快速傳輸
Spine-Leaf 架構(gòu)減少了核心層,實(shí)現(xiàn)了層次的扁平化,如下圖所示。
此外,關(guān)于Spine-Leaf 架構(gòu)的其他常見(jiàn)差異如下:
放棄了生成樹(shù)協(xié)議 (STP)
越來(lái)越多地使用固定端口交換機(jī)而不是網(wǎng)絡(luò)骨干的模塊化模型
橫向與縱向基礎(chǔ)架構(gòu)的擴(kuò)展
上文有提到如今東西向流量越來(lái)越多,低延遲、優(yōu)化流量對(duì)于東西向流量的性能至關(guān)重要,尤其是在時(shí)間敏感或數(shù)據(jù)密集型應(yīng)用程序中。Spine-Leaf架構(gòu)的主要好處之一就是它允許數(shù)據(jù)流從數(shù)據(jù)的源到數(shù)據(jù)的目標(biāo)路徑較短。無(wú)論源和目的地如何,Spine-Leaf結(jié)構(gòu)中的數(shù)據(jù)流在網(wǎng)絡(luò)上的跳數(shù)都相同,任意兩個(gè)服務(wù)器之間都是Leaf—>Spine—>Leaf三跳可達(dá)的。
由于Spine-Leaf 架構(gòu)不再需要 STP,容量也得到了提高。其依賴諸如 ECMP(等價(jià)多路徑)路由等協(xié)議來(lái)平衡所有可用路徑上的流量,同時(shí)仍然避免網(wǎng)絡(luò)環(huán)路。
除了更高的性能外,Spine-Leaf 架構(gòu)還提供了更好的可擴(kuò)展性。可以添加額外的Spine交換機(jī)并將其連接到每個(gè)Leaf ,從而進(jìn)一步增加容量。同樣,當(dāng)端口密度成為問(wèn)題時(shí),可以無(wú)縫添加新的Leaf 交換機(jī)。在這兩種情況下,網(wǎng)絡(luò)都不必為基礎(chǔ)設(shè)施的這種擴(kuò)展(“橫向擴(kuò)展”)而重新設(shè)計(jì),也沒(méi)有停機(jī)時(shí)間。
關(guān)鍵詞: 數(shù)據(jù)中心網(wǎng)絡(luò) 數(shù)據(jù)中心 云數(shù)據(jù)中心 層次化模型